1
Le goulot d'étranglement matériel : Mémoire et limites des ressources
AI032Lesson 5
00:00

Les systèmes informatiques à haute performance modernes font face à un défi fondamental "Mur de mémoire": la croissance explosive du débit de calcul (FLOPS) a considérablement dépassé les augmentations modérées en bande passante de la mémoire globale bande passante. Cette divergence transforme les grands ensembles de cœurs multicores en processeurs « affamés », en attente de données.

1. L'écart de bande passante

Alors qu'une carte graphique peut effectuer des billions d'opérations par seconde, le chemin physique vers la DRAM est limité par la densité des broches et les contraintes de puissance. La mémoire comme facteur limitant de la parallélisation signifie que, lorsque vous augmentez le nombre de threads, la bande passante par thread diminue, entraînant des cycles d'attente où l'appareil reste inactif.

2. L'analogie de la cuisine

Imaginez une cuisine haut de gamme (les cœurs GPU) capable de préparer 1 000 repas par heure. Toutefois, les ingrédients sont entreposés dans un entrepôt (mémoire globale) à cinq kilomètres de là, et il n'y a qu'un seul scooter de livraison (le bus mémoire). Quel que soit le nombre de cuisiniers embauchés, votre production est limitée par la vitesse du scooter.

3. Contraste architectural

Un système CPU multicœur classique système multicœur CPU utilise de vastes mémoires cache pour masquer la latence de quelques threads intensifs. Les architectures parallèles massives, en revanche, doivent faire face à un embouteillage constant de requêtes simultanées. Limitations des ressources au niveau des registres et de la mémoire partagée dictent le niveau maximal de parallélisation (occupation) atteignable avant que le matériel ne soit submergé.

Intensité arithmétique (FLOPs/Octet)Performances (GFLOPS)Limité par la mémoireLimité par le calcul (pic)
main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>